中心極限定理と大数の法則

確率の不思議な法則を探検しよう

はじめに:二つの重要な法則

統計学には、とても大切な二つの法則があります。大数の法則中心極限定理です。
これらは確率と統計の基礎となる重要な考え方で、様々な分野で応用されています。

今日は、これらの法則をコイン投げの実験を通して、分かりやすく学んでいきましょう!

大数の法則:繰り返すと真の値に近づく

大数の法則は、十分に多くの試行を行うと、結果の平均が期待値
(理論上の平均値)に近づく
というものです。
簡単に言えば、「たくさん繰り返すと、理論的に予測される値に近づく」ということです。

コイン投げの例

公平なコインを投げると、表が出る確率は理論的には0.5(50%)です。

  • 10回投げた場合:表の出る割合は0.4や0.6など、0.5から少しずれることが
  • よくあります。
  • 100回投げた場合:表の出る割合は0.45や0.55など、0.5により近くなる傾向が
  • あります。
  • 1,000回投げた場合:表の出る割合は0.49や0.51など、0.5にさらに近づきます。
  • 10,000回投げた場合:表の出る割合は0.495や0.505など、ほぼ0.5に近く
  • なります。

ポイント:大数の法則は、試行回数を増やせば増やすほど、実験結果の平均が
「真の確率」に近づくことを教えてくれます。これが「繰り返し実験が重要」と
言われる理由です。

数学的な表現

確率変数X₁, X₂, X₃, ... , Xnが互いに独立で同一の確率分布に従い、期待値μを持つとき、大数の法則は次のように表されます:

limn→∞ P(|X̄n - μ| < ε) = 1 (任意の正数εに対して)

ここで、X̄nはX₁からXnまでの平均値です。つまり、試行回数nが無限に大きくなると、標本平均X̄nが真の期待値μに収束する確率は1になります。

中心極限定理:平均は正規分布に近づく

中心極限定理は、独立した確率変数の和(または平均)が、試行回数が増えるほど
正規分布(ガウス分布)に近づく
という法則です。これは、元のデータがどんな分布に
従っていても成り立ちます!

簡単な例で考える

多くの人の身長データを集めて平均を取ると、その平均値の分布は正規分布に近づきます。これは、個々の身長がどんな分布に従っていても成り立ちます。

コインを投げる場合も、「n回投げて表が出る回数」は、nが大きくなるほど正規分布に近づきます。

数学的な表現

確率変数X₁, X₂, X₃, ... , Xnが互いに独立で同一の確率分布に従い、期待値μと分散σ
をもつとき、中心極限定理は次のように表されます:

Zn = (X̄n - μ) / (σ/√n) → N(0,1) (n→∞のとき)

ここで:

  • nはX₁からXnまでの平均値
  • N(0,1)は標準正規分布(平均0、分散1の正規分布)

つまり、標本平均X̄nは、nが大きくなるにつれて、平均μ、分散σ²/nの正規分布に従うようになります。

重要ポイント:中心極限定理は統計学の最も重要な定理の一つで、標本平均の分布が正規分布に近づくことを保証します。これにより、標本から母集団の特性を推定する際に、様々な統計的手法を適用できるようになります。

2項分布:コイン投げの確率分布

コイン投げのような「成功か失敗か」の2つの結果しかない試行を繰り返すとき、その結果は2項分布に従います。

2項分布の特徴

  • 各試行は独立している(前の結果が次の結果に影響しない)
  • 各試行の「成功確率」は常に一定(コインなら表が出る確率は常に0.5)
  • 試行の結果は「成功」か「失敗」の2種類だけ
P(X = k) = nCk × pk × (1-p)n-k

ここで:

  • P(X = k):n回の試行で成功がちょうどk回起こる確率
  • nCk:n個からk個を選ぶ組み合わせの数
  • p:1回の試行での成功確率
  • n:試行回数

コイン投げの例

公平なコイン(表が出る確率p = 0.5)を10回投げるとき、表がちょうど6回出る確率は:

P(X = 6) = 10C6 × 0.56 × 0.54 = 210 × 0.015625 × 0.0625 = 0.205

つまり、約20.5%の確率で表がちょうど6回出ます。

上の図は、コインを10回投げたときに表が出る回数の確率分布(青い棒グラフ)と、これが正規分布に近似できること(ピンクの点線)を示しています。これは中心極限定理の一例です。

インタラクティブ:コインスピン実験

ページを開いて実験してみよう

まとめ:二つの法則の関係と重要性

大数の法則平均値は真の値近づく

中心極限定理
平均値の分布は正規分布に近づく統計的推測


両方の法則が教えてくれること

  • データ量の重要性:両方の法則とも、データが多いほど信頼性が高まることを示しています。
  • 統計的推測の基盤:これらの法則があるからこそ、サンプルから母集団の特性を推測できます。
  • 「法則」の力:ランダムな現象でも、十分な数のデータがあれば規則性が見えてきます。

現実世界での応用例:

  • 医療研究:新薬の効果を測定する際、十分な患者数があれば信頼性の高い結論が得られます。
  • 品質管理:工場で製品の品質を確認する際、サンプル検査の結果から全体の品質を推測できます。
  • 世論調査:少数の人にアンケートをとった結果から、国全体の意見を推測できます。

統計学のこれらの法則は、日常生活からビジネス、科学研究まで、あらゆる分野で活用されています。データから正しい結論を導くために、とても重要な基礎となっているのです。